Search Console說明-讓 Google 知道您的網站上有哪些重複內容

123

瞭解重複的網址所造成的影響

有些網站有時會透過「工作階段 ID」或其他「網址參數」以不同的網址提供相同的內容。「工作階段 ID」是附加在網址路徑後的一個數字,與該 ID 相對應的使用者瀏覽網站時,可以針對該位使用者建立自訂體驗內容的新網頁。舉例來說,工作階段 ID 允許購物網站區分不同的客戶,如此一來,每位使用者在瀏覽網站目錄時,都可以看到自己購物車中的項目。而「網址參數」則不會特別辨識個別客戶:舉例來說,客戶在寵物商店網站上搜尋「小狗」時,可以選擇按照年齡、品種、顏色或價格範圍篩選搜尋結果或予以分類。每一個篩選組合隨後都會成為不同的網址,因為篩選器會在原本的網址路徑上附加新的字串或參數,藉此改變客戶看到的網頁內容;但一般來說,這些網址會包含相似或重複的搜尋結果。

範例

下列網址會指向同樣的內容:一系列綠色洋裝 (雖然其中部分網頁安排或篩選的方式會有些許不同)。

 http://www.example.com/products/women/dresses/green.htm
http://www.example.com/products/women?category=dresses&color=green
http://example.com/shop/index.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123&affid=431

Google 偵測到重複的內容 (例如上述範例中的網頁) 時,Google 演算法會將重複的網址歸類為同一個叢集,並且為該叢集選取演算法認為在搜尋結果中「最具代表性」的網址;舉例來說,Google 可能會選擇含有最多內容的網址。然後,Google 會整合叢集中網址的已知內容 (例如連結熱門度),進一步產生代表性網址,最終提升 Google 搜尋中網頁排名與搜尋結果的精確度。

但是在各種情況下,Google 有可能無法找到叢集中的所有網址,或是無法選取您偏好的代表性網址。網址參數工具可協助您為 Google 提供相關資訊,瞭解如何處理包含特定參數的網址。

提醒您,使用網址參數工具時請特別小心。如果您在為 Google 指示不應檢索的重複內容時發生錯誤,Google 可能會停止檢索這些您希望出現在 Google 搜尋中的網頁。

舉例來說,如果您告訴 Google 只有在網址具備 food=savory 這個值的時候才檢索含有 food 參數的網址,Google 可能就不會檢索網址路徑中含有 food=sweet 的網址。因此,您的網站中含有甜點的網頁都不會顯示在 Google 搜尋中。

 

使用網址參數工具分類參數

您可以使用網址參數工具,為 Google 指明您網站上參數的用途。舉例來說,如果您是全球購物網站的擁有者,可以告知 Google 您使用了 country 參數來區分各國家/地區消費者的專屬網頁。接著,由於 Google 可能會檢索且包含這些參數的網址,因此您可以指定偏好設定,讓 Google 檢索偏好的網址版本,或是避免 Google 檢索網站上重複的內容。

將偏好的網址參數處理方式告知 Google

  1. 在您要為 Google 定義的參數旁邊按一下 [編輯] 按鈕。如果系統並未列出您要定義的參數,按一下 [新增參數] 即可建立新參數。請注意,這個工具會區分大小寫,因此請完全依照網址中顯示的內容輸入參數。
  2. 在對話方塊中選取 [是] 或 [否],將您的參數設定為主動式被動式
    • 被動式參數:選取 [否]。
    • 主動式參數:選取 [是],然後選擇隨即顯示的其中一個選項,讓 Google 瞭解應如何檢索含有這個參數的網址。選項相關說明請參考下表。
      • 讓 Googlebot 決定:這是不錯的常用選項。如果您不確定參數的行為,或者不確定參數的行為是否會變更網站的其他部分,請選取這個選項。Googlebot 會分析您的網站,決定處理參數的最佳方式。
      • 檢索內含這個參數的所有網址:您可以使用這項設定告訴 Google,擁有唯一特定參數值的網址不會包含重複內容。如果要為參數選取這個選項,請務必確定參數會影響或變更網頁內容,否則 Googlebot 可能會對網站上的重複內容進行不必要的檢索。Google 會依據這個參數的值比較網址,判斷網址是否重複。舉例來說,您為包含 productid 參數的網址實作了這類設定後,Google 會自動將 http://ww.example.com/dresses/real.htm?productid=1202938http://www.example.com/dresses/real.htm?productid=5853729 視為截然不同的網址,因為兩個網址具備不同的 productid 參數值。
      • 僅檢索含有所選參數值的網址:您可以使用這項設定告訴 Google,只對網址參數已設定為指定值的網址進行檢索。Googlebot 只會對參數值與指定值相符的網址進行檢索,而不會檢索含有其他參數值的網址。如果網站使用該參數值變更內容的順序 (否則會顯示相同的內容),則特別適合選取這個選項。舉例來說,http://www.example.com/dresses/real.htm?sort=price_highhttp://www.example.com/dresses/real.htm?sort=price_low 擁有相同的內容。您可以使用這項設定告訴 Googlebot,只對含有 sort=price_low 的網址進行檢索,以免檢索重複的內容。
      • 不會檢索含有這個參數的網址:您可以使用這個選項告訴 Google,無需檢索任何含特定參數的網址。Google 不會對任何含有指定參數的網址進行檢索。您可以告訴 Google,如果網址含有 pricefrompriceto 則不要加以檢索,以免針對重複的內容進行不必要的檢索。舉例來說,http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5&pricefrom=10&priceto=1000http://www.examples.com/search?category=shoe&brand=nike&color=red&size=5 含有相同的內容,因此只需檢索後者即可。

主動式和被動式參數

網址參數工具會將參數分類為主動式或被動式:

主動式參數

主動式參數會變更網頁內容,例如 brandgendercountrysortorder 這類參數。主動式參數會建立以下這些常見的轉換類型:

  • 排序 (例如 sort=price_ascending):變更顯示內容的順序。
  • 限制 (例如 t-shirt_size=XS):篩選網頁上的內容。
  • 指定 (例如 store=women):決定網頁上顯示的內容組合。
  • 翻譯 (例如 lang=fr):顯示經過翻譯的內容。
  • 編排頁次 (例如 page=2):顯示長篇資訊或文章的特定頁次。請注意,您也可以直接顯示分頁內容

被動式參數

被動式網址參數不會影響使用者看到的內容,通常用於追蹤訪客和參照網址,而且不會影響網頁的實際內容。舉例來說,下列網址都指向完全相同的內容:

  • http://www.example.com/商品/女性/洋裝?sessionid=12345
  • http://www.example.com/商品/女性/洋裝?sessionid=34567
  • http://www.example.com/商品/女性/洋裝?sessionid=34567&source=google.com

被動式參數的其他範例包括:sessionidaffiliateid

選擇標準網址

如果透過多個網址均可連結至網站發佈的內容,您可以指定標準 (偏好) 版本的網址,選擇要在 Google 搜尋結果中顯示的代表網址。這項作業可透過網址參數工具進行,或者您也可以選擇在偏好網址的 HTML 原始碼中新增 rel="canonical" 元素。

提醒您,如要新增 rel="canonical",您必須能夠編輯網頁的原始碼。進一步瞭解如何使用標準網址

發佈留言